بررسی مشکلات جستوجو و بازیابی اطلاعات در پایگاههای اطلاعاتی از جنبه ویژگیهای نگارشی زبان فارسی
نویسندگان
چکیده مقاله:
The present research was carried out with the aim of explicating the major writing and semantic problems of Persian language when using data environments and determining the degree of compatibility and attention to these features in Persian databases. This research is of survey analytical type being conducted through direct observation. Having reviewed the related literature, we kept a checklist of search keywords. Each of these keywords was searched in the databases under study, such as Iranian Research Institute for Information Science and Technology, Regional Centre for Information Science and Technology, NoorMagaz, and Scientific Information Database affiliated with Jahad Daneshgahi, and the number of retrieved findings was recorded. Some of the writing and semantic features of Persian language contribute to problems associated with retrieving information from the selected databases. Some of these features include connected and disconnected forms of writing of derivative, compound, and derivative-compound words, diversity of plural forms, loanwords and their equivalents in writing as well as polysemy, homonymy, etc., in semantics. For instance, retrieving different results for various writing forms of the keywords «فناوری و فن آوری» as derivative-compound words or «پتاسیوم و پتاسیم» as various forms of recording words, or retrieving different findings for keywords «دریای خزر، دریای مازندران و دریای کاسپین» as well as lack of their appropriate coverage as synonymous words and giving the user information about it in order to improve the exploration process, for it has negative effects on search and retrieval process. Findings indicated that Persian databases do not pay adequate attention to writing and semantic features of Persian language, and disregard many of its features in searching and retrieving information. In connection with the impact of these features on the interaction of users with databases, Persian-speaking users’ need for native exploration tools and databases designed in accordance with the features of their own language have become more and more urgent. The present research has examined the ability of Persian databases in covering some of the features of this language, which have a noticeable impact on the process of searching and retrieval, pinpointing the weak points and strengths of these databases. The results of the present research could be utilized to improve the performance of the above-mentioned databases.
منابع مشابه
بررسی رویکردهای موضوعی (زبان طبیعی و کنترلشده) در بازیابی اطلاعات از پایگاههای پیوسته کتابشناختی
در این پژوهش کاربردی که با استفاده از تحلیل محتوا انجام شده است، کارایی دو رویکرد جستجوی موضوعی: زبان طبیعی و واژگان کنترل شده با استفاده از معیارهای ربط، دقت، بازیافت و ریزش کاذب، در دو پایگاه کتابشناختی پیوسته (کتابخانه کنگره واریک) مقایسه شده است. سی عنوانمربوط به موضوعات کتابخانه، کتابداری و اطلاعرسانی به صورت تصادفی انتخاب شدند. برای هر عنوان راهب...
متن کاملهمبستگی نظریه امیدواری در دقت بازیابی اطلاعات از پایگاههای اطلاعاتی علوم پزشکی
The purpose of this study was to determine correlation of hope theory on precision of users’ information retrieval from databases of medical science. Research method was quasi experimental, and the population consisted of 45 final year medical students at medical Universities in Tehran. The data gathering instrument was the Schneider (1991) hope questionnaire that has 12 questions. Schneider qu...
متن کاملبررسی تأثیرات ریشهیابی در بازیابی اطلاعات در زبان فارسی
Using the language-specific behavior in information retrieval systems can improve the quality of the retrieved results significantly. Part of the word that remains after removing its affixes is called stem. Stemming process can be used for improving the relevancy of the results in information retrieval system. Different morphological variants of words (plural, past tense…) will be mapped into t...
متن کاملآسیبشناسی انگلیسینویسی مآخذ فارسی در مقالات و چالشهای آن در بازیابی اطلاعات از پایگاههای اطلاعاتی
هدف: آسیبشناسی منابع فارسی که بهصورت انگلیسی نوشته میشوند در نظام جستجوی پایگاههای اطلاعاتی ایرانی. روششناسی: با رویکرد ترکیبی از طریق دو روش تحلیلمحتوا و پیمایش 30 نشریه علمی پژوهشی از سه حوزه وزارت علوم، وزارت بهداشت و دانشگاه آزاد از سال 1384 تا 1394که یک شماره از آنها دارای منابع انگلیسینویسی شده بودند انتخاب و با مطالعه طولی و روشهای آمار توصیفی دادههای بهدست آمده تحلیل شد. یاف...
متن کاملتعامل تلفظ و نگارش ارتباط بین مشکلات تلفظی و خطاهای نگارشی فارسی آموزان غیر فارسی زبان
آنچه در پژوهش های انجام شده در حوزة آموزش زبان فارسی بیشتر دیده می شود، جدایی آموزش تلفظ از آموزش نگارش است. در این پژوهش، با تمرکز بر خطاهای زبانی زبان آموزان فارسی در حوزة آواها، به بررسی رابطة بین خطاهای تلفظی موجود در گفتار آنان با خطاهای موجود در نوشتار همان زبان آموزان پرداخته ایم. با این بررسی درصددیم تا نشان دهیم این دو حوزه اندرکنش های فراوانی داشته و تقویت یکی به معنی تقویت دیگری است....
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 33 شماره 3
صفحات 1087- 1110
تاریخ انتشار 2018-06
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023